iT邦幫忙

2021 iThome 鐵人賽

DAY 12
0
自我挑戰組

資料分析及AI深度學習-簡單基礎實作系列 第 12

DAY12:玉山人工智慧挑戰賽-中文手寫字辨識(前言)

  • 分享至 

  • xImage
  •  

參賽契機

  • 之前參加資策會,結訓時都會做個專題啦,但因為我自己對我們組的專題挺不滿意,而且對於深度學習這塊,資策會老師由於課堂太少,講話跟開飛機一樣快,這個部分完全沒涉略到!結訓後,剛好看到有這比賽,跟資策會小夥伴們就組隊參加啦!

  • 想實作圖像辨識,實作一次超越只看書所得到的東西,可以與隊友討論,做的結果好不好其次,還可以得到前三名的分享,我相信對於未來工作也是非常有幫助的。


比賽內容介紹

  1. 名稱:玉山人工智慧挑戰賽2021夏季賽-中文手寫影像辨識
  2. 比賽時間:2021/4/12-2021/6/18
  3. 比賽內容:
    • 玉山提供約70000張中文手寫字的圖檔,檔名即是那個圖檔的字(標籤)。
    • 參賽者需要辨識的有800個中文字,若圖檔文字非在800字內或無法辨識,則要判定為isnull。
    • 參賽者利用各種方法去做辨識,只要API不連結人工(例如:Line)皆可。
    • 將訓練好的模型及完成的API,部署到Google Cloud Platform進行比賽。
  4. 比賽成績:
    • 比賽成績為所有參賽隊伍前10%,不是特別好的成績,但對我們來說初體驗得到這樣得結果,我們已經很開心了,從比賽中得到的收穫更是滿載而歸。

觀察資料集

  • 拿到資料後,我們觀察到玉山給的圖檔裡面有些許問題:

    • 空白圖檔
    • 一張圖片多個文字
    • 標籤錯誤
    • 圖檔的字不明確
  • 我們討論過後,決定用YOLOv4來處理多字的部分,將他切割成一個字一個字。

  • 標籤錯誤的部分,我們只能人力分工去手動更改標籤。

  • 最後還會用OpenCV將邊框紅線部分去掉。


今日小結

  • 我怕我上述那樣打好像我在黑資策會,我並沒有那個意思喔!師資沒問題,是因為只有半年的時間,幾乎每天上課,要學程式、學資料庫、學統計等等,真的很多課程很豐富,只可惜時間太少,我個人比較笨一點,吸收比較慢,我還是很感謝去資策會所學到的,以及在資策會交到共同興趣的好朋友們,讓我能在結訓後還能與他們一起研究學習。
  • 今天只是先簡單介紹一下,此比賽的規則及內容,明天會以資料前處理YOLOv4的部分來做分享。

上一篇
DAY11:機器學習模型_筆記分享
下一篇
DAY13:玉山人工智慧挑戰賽-中文手寫字辨識(資料前處理)
系列文
資料分析及AI深度學習-簡單基礎實作30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言